第八章:生成對抗網絡
關燈
小
中
大
“不,並不是。”周婺否認得飛快。
周婺的發言顯然讓穆濛大吃一驚,以至於穆濛不知如何接話,現在穆濛才發現,在莫如寄的這件事情上,似乎從頭到尾就只有她在自作多情。
可穆濛不知道的是,此刻周婺腦海中忽然閃現出一個畫面。
畫面中,周婺只有八歲。
八歲的小周婺早已被熊熊燃燒的火焰包圍,她驚慌不已,想要逃跑卻是寸步難行,因為她所在的房間裏,唯一的大門被左邊倒塌的書櫃堵住,只在左下角留下了一條細縫。由於書櫃很沈,小時候的周婺哪有力氣推開!正當小周婺徹底絕望到嚎啕大哭之時,隔著書櫃,她忽然聽到了一個稚嫩的男聲,聽著聲音,周婺可以判斷出門外的那個男孩應與自己的年紀相仿,小男孩當時只是輕輕說了幾句話,就讓驚恐萬分的小周婺鎮定了下來。
想到這裏,周婺強行把自己從這個回憶中拉出。因為目前情況緊急,她現在要做的應是找到兇手的破綻,支援鄭均在地下的搜查工作!
於是,周婺定了定神,對穆濛解釋道:“莫如寄在約翰時報上一共發表過大大小小兩千多篇文章,他文章中使用的模型,大約有85%的模型不過是簡單的多元線性回歸,此外的15%,只是一些簡單的logistics回歸和方差分析,然而這些分析方法都無法解決當下的問題。”
“怎麽會……”穆濛分明有些懵了。
周婺頓了頓,才皺眉說道:“更何況,莫如寄在約翰時報上所建的模型,80%都有技術上的錯誤,譬如統計學上的多重共線性、異方差性、自相關性他都沒有考慮,再者異常值和高杠桿點他也沒有標出……所以我並不喜歡他的文章,甚至認為他的文章有些異想天開。”
就是這番話,讓穆濛瞬間看不懂周婺此人!
她不明白,為何周婺不喜歡莫如寄的文章可又對莫如寄極為關註,因為連身為莫如寄鐵粉的自己都不可能將莫如寄發表的所有文章都歸納得如此精準!但穆濛來不及再過多詢問莫如寄的相關細節,畢竟現在的情況更加緊急!
“那您要怎麽辦?”穆濛又問。
“deep learning”周婺吐出了一個詞。
“deep learning?深……深度學習?”這個詞穆濛很熟悉,也經常出現在很多文章期刊之中,但她也只停留在聽過的程度。
“沒錯,deep learning,深度學習。這個詞的出現是在machine learning之後。Machine learning翻譯成中文則是機器學習,機器學習可以簡單理解為數據挖掘的各種非傳統的分析方法。與機器學習類似,在我看來,深度學習也是挖掘數據的一種方法。與機器學習不同的是,深度學習主要是基於神經網絡展開,即通過構建神經節點達到模擬人類細胞神經結構的目的。通常意義上來說,計算機能夠計算人類無法計算的數學模型,畢竟高強度的計算對計算機來說是極為簡單輕松的,譬如人類需要一天時間手算的模型,計算機也許只需十秒就能給出結論。但真正困難的是如何讓計算機去判別一個人類很容易判別的事物。”周婺說得飛快,可她敲擊鍵盤的雙手卻從未停過。
“這很困難?”
“沒錯。比如說你認為我是周婺,同時也是一個人。無論我戴著墨鏡還是穿著古怪的服裝,你都能夠把我是人類,且名叫周婺的事實識別出來。可若讓機器識別,卻會存在一定的報錯風險。假設我的右腿受傷並換成了機械腿,更極端的情況——就像《攻殼機動隊》裏的女主一樣,全身都是機械做的義體,只有大腦保持著作為人類的生物特征。那這類人,若讓現在的智能系統判斷,機器更可能會把其當作是一臺機器。可事實上,從人類思維是否存在的角度來看,這群人理應被判別為人的範疇。但是若以思維是否存在來衡量這個物種是否是人類,這也是不科學的。比如說,一個機器通過訓練最終擁有了類似於人類的思維意識,也就是現在人們定義的強人工智能,那麽你會認為這個機器和我們人類是同一個物種麽?”
“不,不是一個物種,因為本源是不一樣的。”穆濛連忙搖頭。
周婺不口否認地點了點頭,繼續用類似於機關槍似的聲線陳述道:“沒錯,也就是說,人類的判別是多變的,我們判別一個物體是否是人,不單單只看一個方面和既有規則,在當下規則不完備的情況,我們甚至會創造新的判別規則。只是,當前我們的機器判別,實際上是建立在人類規則之上的,判別是否為人的規則可能就是人類的外貌特征,而為了很好地把人類與機器人區分,他們還會加一條人類身上沒有機器零件或機器零件的比例在一個閾值之下(1)。可當機器零件的比例在這個定義的閾值之上時,系統就會將其自動劃定到機器人之列。假設這個閾值是百分之五十,那麽問題來了,如果一個人類身體上有百分之五十一以上的部分都是機器,你也清楚的知道這個人本就是人,但計算機的判別卻會出錯。”
由於周婺語速過快,穆濛只聽懂了百分之五十左右,但即便如此,穆濛還是捕捉到了一些她比較熟悉的詞語,道:“所以您是要用深度學習的方法建模?”
“沒錯,建模思路是基於GAN。”
“幹?幹什麽?”穆濛歪著頭問道。
“GAN是Generative Adversarial Networks的縮寫,翻譯過來又叫生成對抗網絡,是當下深受歡迎的模型之一。除去最基礎的GAN,已陸續延伸出InfoGAN、ACGAN、LSGAN等等。GAN的思路則是隨機生成一組樣本,之後固定樣本,讓該樣本與真實樣本進行比較,從而訓練出一個判別函數,使得判別函數能夠最大化地區分真實數據與生成樣本。之後再固定判別函數,繼續模擬生成新的樣本,讓新樣本更好模仿真實樣本,從而達到判別函數最小化區分真實數據與生成樣本的目的。這兩步不斷循環不斷地生成對抗,最後當生成樣本以假亂真到函數無法區分時,我們就有證據證明我們的訓練樣本與真實數據一致性的概率極高(2)。而在GAN的基礎上,目前已發展了很多變形,GAN與諸多神將網絡相結合,模型訓練效果往往能夠以假亂真。從GAN的運用上看,GAN不光在低像素變高像素的方面運用廣泛,在圖像去遮擋方面也有了很多成功的案例,此外在創作詩詞和小說方面,GAN也有很好地運用,而且通過模型訓練,其生成的小說還不賴。”
由於周婺本身語速極快,加上內容過於覆雜,穆濛的腦負荷早已超過上限,她只是呆呆地盯著周婺屏幕密密麻麻的代碼,呆得張大了嘴巴,不再接話。
本站無廣告,永久域名(danmei.twking.cc)
周婺的發言顯然讓穆濛大吃一驚,以至於穆濛不知如何接話,現在穆濛才發現,在莫如寄的這件事情上,似乎從頭到尾就只有她在自作多情。
可穆濛不知道的是,此刻周婺腦海中忽然閃現出一個畫面。
畫面中,周婺只有八歲。
八歲的小周婺早已被熊熊燃燒的火焰包圍,她驚慌不已,想要逃跑卻是寸步難行,因為她所在的房間裏,唯一的大門被左邊倒塌的書櫃堵住,只在左下角留下了一條細縫。由於書櫃很沈,小時候的周婺哪有力氣推開!正當小周婺徹底絕望到嚎啕大哭之時,隔著書櫃,她忽然聽到了一個稚嫩的男聲,聽著聲音,周婺可以判斷出門外的那個男孩應與自己的年紀相仿,小男孩當時只是輕輕說了幾句話,就讓驚恐萬分的小周婺鎮定了下來。
想到這裏,周婺強行把自己從這個回憶中拉出。因為目前情況緊急,她現在要做的應是找到兇手的破綻,支援鄭均在地下的搜查工作!
於是,周婺定了定神,對穆濛解釋道:“莫如寄在約翰時報上一共發表過大大小小兩千多篇文章,他文章中使用的模型,大約有85%的模型不過是簡單的多元線性回歸,此外的15%,只是一些簡單的logistics回歸和方差分析,然而這些分析方法都無法解決當下的問題。”
“怎麽會……”穆濛分明有些懵了。
周婺頓了頓,才皺眉說道:“更何況,莫如寄在約翰時報上所建的模型,80%都有技術上的錯誤,譬如統計學上的多重共線性、異方差性、自相關性他都沒有考慮,再者異常值和高杠桿點他也沒有標出……所以我並不喜歡他的文章,甚至認為他的文章有些異想天開。”
就是這番話,讓穆濛瞬間看不懂周婺此人!
她不明白,為何周婺不喜歡莫如寄的文章可又對莫如寄極為關註,因為連身為莫如寄鐵粉的自己都不可能將莫如寄發表的所有文章都歸納得如此精準!但穆濛來不及再過多詢問莫如寄的相關細節,畢竟現在的情況更加緊急!
“那您要怎麽辦?”穆濛又問。
“deep learning”周婺吐出了一個詞。
“deep learning?深……深度學習?”這個詞穆濛很熟悉,也經常出現在很多文章期刊之中,但她也只停留在聽過的程度。
“沒錯,deep learning,深度學習。這個詞的出現是在machine learning之後。Machine learning翻譯成中文則是機器學習,機器學習可以簡單理解為數據挖掘的各種非傳統的分析方法。與機器學習類似,在我看來,深度學習也是挖掘數據的一種方法。與機器學習不同的是,深度學習主要是基於神經網絡展開,即通過構建神經節點達到模擬人類細胞神經結構的目的。通常意義上來說,計算機能夠計算人類無法計算的數學模型,畢竟高強度的計算對計算機來說是極為簡單輕松的,譬如人類需要一天時間手算的模型,計算機也許只需十秒就能給出結論。但真正困難的是如何讓計算機去判別一個人類很容易判別的事物。”周婺說得飛快,可她敲擊鍵盤的雙手卻從未停過。
“這很困難?”
“沒錯。比如說你認為我是周婺,同時也是一個人。無論我戴著墨鏡還是穿著古怪的服裝,你都能夠把我是人類,且名叫周婺的事實識別出來。可若讓機器識別,卻會存在一定的報錯風險。假設我的右腿受傷並換成了機械腿,更極端的情況——就像《攻殼機動隊》裏的女主一樣,全身都是機械做的義體,只有大腦保持著作為人類的生物特征。那這類人,若讓現在的智能系統判斷,機器更可能會把其當作是一臺機器。可事實上,從人類思維是否存在的角度來看,這群人理應被判別為人的範疇。但是若以思維是否存在來衡量這個物種是否是人類,這也是不科學的。比如說,一個機器通過訓練最終擁有了類似於人類的思維意識,也就是現在人們定義的強人工智能,那麽你會認為這個機器和我們人類是同一個物種麽?”
“不,不是一個物種,因為本源是不一樣的。”穆濛連忙搖頭。
周婺不口否認地點了點頭,繼續用類似於機關槍似的聲線陳述道:“沒錯,也就是說,人類的判別是多變的,我們判別一個物體是否是人,不單單只看一個方面和既有規則,在當下規則不完備的情況,我們甚至會創造新的判別規則。只是,當前我們的機器判別,實際上是建立在人類規則之上的,判別是否為人的規則可能就是人類的外貌特征,而為了很好地把人類與機器人區分,他們還會加一條人類身上沒有機器零件或機器零件的比例在一個閾值之下(1)。可當機器零件的比例在這個定義的閾值之上時,系統就會將其自動劃定到機器人之列。假設這個閾值是百分之五十,那麽問題來了,如果一個人類身體上有百分之五十一以上的部分都是機器,你也清楚的知道這個人本就是人,但計算機的判別卻會出錯。”
由於周婺語速過快,穆濛只聽懂了百分之五十左右,但即便如此,穆濛還是捕捉到了一些她比較熟悉的詞語,道:“所以您是要用深度學習的方法建模?”
“沒錯,建模思路是基於GAN。”
“幹?幹什麽?”穆濛歪著頭問道。
“GAN是Generative Adversarial Networks的縮寫,翻譯過來又叫生成對抗網絡,是當下深受歡迎的模型之一。除去最基礎的GAN,已陸續延伸出InfoGAN、ACGAN、LSGAN等等。GAN的思路則是隨機生成一組樣本,之後固定樣本,讓該樣本與真實樣本進行比較,從而訓練出一個判別函數,使得判別函數能夠最大化地區分真實數據與生成樣本。之後再固定判別函數,繼續模擬生成新的樣本,讓新樣本更好模仿真實樣本,從而達到判別函數最小化區分真實數據與生成樣本的目的。這兩步不斷循環不斷地生成對抗,最後當生成樣本以假亂真到函數無法區分時,我們就有證據證明我們的訓練樣本與真實數據一致性的概率極高(2)。而在GAN的基礎上,目前已發展了很多變形,GAN與諸多神將網絡相結合,模型訓練效果往往能夠以假亂真。從GAN的運用上看,GAN不光在低像素變高像素的方面運用廣泛,在圖像去遮擋方面也有了很多成功的案例,此外在創作詩詞和小說方面,GAN也有很好地運用,而且通過模型訓練,其生成的小說還不賴。”
由於周婺本身語速極快,加上內容過於覆雜,穆濛的腦負荷早已超過上限,她只是呆呆地盯著周婺屏幕密密麻麻的代碼,呆得張大了嘴巴,不再接話。
本站無廣告,永久域名(danmei.twking.cc)